KMO と MSA
KMO とは,Kaiser-Meyer-Olkin が提唱した因子分析全体についてのサンプリング適切性基準 であり,MSA とは Measures of Sampling Adequacy の頭語で,それぞれの変数についての個別のサンプリング適切性基準である。データセットの中に,十分な数の因子が存在するかどうかを示す指標値である。技術的には,変数間の相関係数の偏相関係数に対する比を計算する。もし偏相関係数が生の相関係数 と同じような値なら,それらの変数は互いに分散をあまり共有していないことを意味する。KMO の範囲 は 0.0 から 1.0 で,0.5 以上が望ましい。また,MSA が 0.5 未満の変数は,その変数がどの因子グルー プにも属していないことを示すので,因子分析から除くべきである。 データが因子分析を用いるのに適切であるか(データに意味のある因子が発見できそうであるか)を判断するための基準として Kaiser-Meyer-Olkinの標本妥当性の測度(KMO 測度)があります。KMO 測度(KMO 指標)はデータの偏相関係数の情報を使って、データに少なくとも1つの潜在因子が存在しそうかを調べます(偏相関係数の2乗和がゼロに近いほどその可能性が高いことを利用します)。
微妙に解説している内容は異なるが、意味的には以下のように解釈した。
因子分析では、それぞれの観測変数の背後に潜在的な変数があり、それによって観測変数にばらつきが出ていると考える。よって、それぞれの観測変数間には何らかの相関があるはずである。
そこで、二つの変数間の偏相関係数が小さくなるということは、他の変数が同じ様な分散を表現していたということになり、潜在的な変数が存在すると予測を立てることができる。